hits相关论文
个性化推荐系统是机器学习的前沿领域,是解决信息过载问题的重要手段之一,通过分析用户的历史行为、社交关系、兴趣点、所处的上下......
随着互联网和电子商务的高速发展,网上购物逐渐代替了传统的购物,成为人们的主要购物方式。如何有效利用用户对商品或服务的评论数......
搜索引擎是目前最主要的Web信息检索工具,然而搜索引擎的效果还不能令人满意。因此,在搜索结果返回用户前需要有一个检索后处理过程,......
近年来,随着互联网信息的快速几何增长,如何及时准确地从互联网上获取有用信息显得十分重要。主题爬虫是一种基于主题的信息采集系......
如何发现Web上根据“主题”聚集在一起的多个社区,使用户很快地从互联网上提取知识,是Web挖掘的一个研究方向。本文在深入研究Web......
随着 Internet 技术的迅猛发展,传统搜索引擎的局限性如覆盖率低、时效性差、结果不准确等日趋明显,针对以上情况,主题搜索引......
我们生活在大数据时代,互联网上海量的数据为科学研究和产品开发提供了巨大的机会和潜能。如何快速而精准地在体量庞大的互联网资......
学位
网络虚拟化技术对于研究网络的发展具有非常大的意义。面向异构资源的网络虚拟化抽象映射是目前解决目前互联网发展瓶颈的一个重要......
介绍超链接环境下基于链接的网页排序算法 ,比较和分析了 Page Rank算法和 HITS算法 ,指出了 Page Rank算法更适合于搜索引擎的服......
摘 要: 提出一种基于用户浏览网页时间的搜索引擎新排名算法time-Rank。该算法根据用户浏览时间的信息,更加准确地计算网页的排名得......
对于过程控制以及SCADA系统,如果你一直在犹豫是否有必要解决网络安全问题以及何时去解决这些问题,那么不妨借鉴一下电力行业的经......
今年进口量3月份又创历史新高,二季度汽车进口月度量都保持在6万辆以上,使得上半年汽车进口量高速增长,同时又升到一个新台阶。
T......
本文介绍了Web结构挖掘的基本概念,分析了HITS和PageRank算法,并对这两种算法进行了比较,最后探讨了基于这两种算法的改进算法.......
Web spamming是指故意误导搜索引擎的行为,它使得一些页面的排序值比它的应有值更高.最近几年,随着web spam的急剧增加,使得搜索引......
描述Web结构挖掘中的链接排序算法PageRank与HITS,并讨论两种算法的优劣,同时,介绍目前针对两种算法的缺陷而形成的改进思想.......
本文通过垂直搜索引擎的关键算法研究,论述垂直搜索引擎设计与实现时的一些独特的信息识别方法,包括Pagerank和HITS算法。......
如何发现Web上根据“主题”聚集在一起的多个社区,使我们能快速地从互联网上提取知识,是Web挖掘的一个研究方向。详细介绍了基于链......
随着网络和数据挖掘技术的发展,Web数据挖掘得到了较多的研究。文章从Web结构挖掘的角度出发,在分析传统的HITS(Hyperlink—Induced T......
本文对Hadoop平台进行了分析研究后,与HITS算法的设计理论和技术相结合,对基于中文词汇网络的HITS算法进行了重新设计,使其符合Hadoop......
给出了为主题精选算法(如HITS)构造Web邻域图的方法和实用系统。该系统基于Web搜索引擎(AltaVista),使用额外的Visual C++软件模块......
传统的HITS算法单纯地对网页的链接结构进行分析,忽视了页面内容分析和网页的链接增幅,导致了主题偏离和搜索精度不高的问题。针对......
在分析Web结构挖掘现有算法的基础上,重点研究了HITS(Hyperlink-Induced Topic Search)算法.Hub页面的多主题性、无关页面和无关链......
随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为国内外研究的热点。基于Web结构挖掘中HITS算法......
网络结构挖掘是以超链接分析为基础,从链接结构中获取有用的知识,利用这些知识,重新组织结构,使内容逻辑结构更加合理。深入研究现有的......
随着计算机的发展,为了能更好地搜索到所需的内容,全文检索引擎已经变得越来越重要。Lucene作为当前最流行的开源Java索引工具包,索引......
随着计算机的发展,为了能更好地搜索到所需的内容,全文检索引擎已经变得越来越重要。Lucene作为当前最流行的开源Java索引工具包,索引......
1.引言万维网WWW(World Wide Web)是一个巨大的、分布全球的信息服务中心,正在以飞快的速度扩展.1998年WWW上拥有约3.5亿个文档[14......
Blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合Blog评论获取Blog文章的主要内容是许多基于Blog的应用所要面临......
对比分析了基于链接分析的搜索引擎排序算法PageRank和HITS,针对原有PageRank算法采用的平分页面自身PageRank值的策略,提出了按基于......
在对HITS算法和基于MapReduce编程模型的云计算框架Hadoop的研究基础上,利用Hadoop来重新设计并实现HITS算法.同时,在实验中分析了不......
讨论了Spam的基本概念和影响,详细分析了当前各种Spamming技术,包括TermSpaming、Link Spamming和隐藏技术三种类型,这对于开发恰当的......
介绍web结构挖掘的概念,并分析基于链接结构的两种重要的Web结构挖掘算法,最后指出其在电子商务网站的应用以提高网站的价值。......
Web结构挖掘是对Web的链接结构进行分析。该文概述Web结构挖掘技术。列举其常见算法。并对PageRank和HITS这两种最重要的Web结构挖......
针对HITS算法中容易出现"主题漂移"的问题,提出了一种新的主题发现算法.首先从对权威度贡献大小的角度出发,将链接分为两类,首尾节点......
对搜索结果的排序是搜索引擎中至关重要的一项技术,算法的好坏直接关系到用户输入关键词后能不能迅速查看到要查找的信息。系统的介......
在传统的向量空间模型中,TF-IDF算法被广泛应用在基于关键字的信息检索中,而随着对web检索研究的不断深入,充分利用Web文档结构的超链......
对传统最大流算法和基于HITS算法的边容量分配最大流算法的实现过程及在社区挖掘中存在的问题进行了详细的研究,提出了基于传递概率......
搜索引擎是目前最主要的Web信息检索工具,然而它的效果还不能令人满意。基于Web链接结构的主题精选算法的链接分析迭代往往会收敛于......
在网络环境下,HITS算法存在一些不足,易产生主题漂移现象。文章在介绍HITS算法的基础上,结合超链接中的锚文本分析,在原有算法的基础上......
HITS是一种经典的链接分析算法,其主要问题是容易发生主题漂移。针对这一问题,提出了一种改进的算法:MCHITS。MCHITS利用最大流算......
由于网络资源的复杂性,通用搜索引擎已经不能满足用户信息检索的准确性需要;为了满足并针对特定领域或特定主题查询的特定用户群的......
在对web结构挖掘的典型算法探讨的基础上,提出了一种PageRsnk算法和HITS算法相结合的改进算法,并对该算法进行了简要分析。......
基于Web超链接分析对当前存在的主流算法PageRank与HITS作了研究.主要讨论了PageRank算法存在评价下滑与评价泄漏的缺陷;简略介绍......
行进中的坦克、装甲车或航行中的舰、艇向目标射击时由于受路面或海浪的环境激励发生随机振动,导致炮弹或枪弹的出口速度发生随机变......
对HITS(Hyperlink-Induced Topic Search)算法进行研究,克服其主体漂移和扩大化等缺点,改进并提出建立一个新的基于链接分析的Web......
问答社区已经成为网络上快速获取知识的重要途径之一。本文首先对问答社区的网络结构进行了分析,发现了它和一般社交网络结构的区......